meta 公开其超级智能实验室使命——为个人赋能
发布于: 2025年8月2日
从一个月前 meta 花一百多亿美元投资 scale ai 并且该公司 ceo 跳槽到 meta 开始,我就一直关注其动向,先后挖了庞若明、赵晟佳等大模型领域的顶尖人才,而且据传庞若明四年能拿到 2 亿美元。
显然这是非常离谱的,这一次 meta 真的下狠心了,但是挖了那么多人花了那么多钱,他到底想干什么?
今早才刷到 meta 发布的小扎介绍超级智能实验室的未来愿景的视频,简单说就是围绕「个人」。
四大能力指向:帮助个人①实现目标、②创造想见之物、③体验任何冒险、④成为更好的伙伴与自己期望的人格。
小扎讲的是,行业里大多数专家把 AI 主要用于「集中式自动化生产」,但是他就不这么认为(挺有个性),他认为应该让个体主导技术的使用方向。
听着有点高大上,具体是什么意思呢?
集中式自动化生产 vs 个体主导的技术使用
这个「集中式自动化生产」具体指的是什么意思呢?它跟这个「个体主导技术的使用方向」有什么不同吗?因为我们如今像 ChatGPT,或者 Claude、Gemini 这些工具,我们也是每个人都有自己的用途,这难道不算后者吗?
我们现在去使用 AI,像用 GPT、Gemini 这些工具,中央大脑和算力都是掌握在大公司手里的,我们只是通过 API 去调用。也就是说,产生的成果是由平台去再分配的。
甚至在使用 GPT 的时候,你可能会遇到比如说 IP 不干净被封控。也就是说 AI 它并不掌握在你的手上,别人有权利直接把你给掐断掉。
这么看,「集中式自动化生产」可能指的是:
- 单一超级智能:想象一座庞大“云上工厂”,所有推理、决策、内容与代码都由同一模型完成。
- 价值观内嵌:少数开发者或监管机构决定模型目标,再由它生成大部分社会财富。
- 人类地位:多数人不再直接劳动,而领取 AI 产出的“分红”或全民基本收入。扎克伯格称这种路线为“中央集权式管控”,担心权力与资源进一步集中。
那扎克博客的「个体主导」理念可能相对的,是去中心化或多代理生态,比如AI 实例嵌入手机、眼镜、私有云,长期跟随同一用户,长期记忆围绕个人生活并且由个人直接驱动和获益。
- 个人超级智能:Meta 设想的 AI 像长期伙伴——了解你的日程、记得家人生日、帮你写代码、创作音乐。
- 硬件承载:戴在身上的 Ray-Ban AI 眼镜、手机、AR 头显成为主要入口,让 AI 处于“随身在线”状态而非远程中枢。
- 多代理生态:可能由无数专属微模型协作,而不是一个“中央大脑”。
回到我们刚刚的问题,为什么 ChatGPT 等产品看似“人人可用”却仍属集中式?
首先是部署模式,用户所有请求回到 OpenAI/Google 的集中算力池处理,决策权与数据归平台。然后还有统一安全层,内容过滤、功能开放由平台集中管理——这正是扎克伯格担心的“技术权力过度集中”。
他还提到一个「自下而上」的路径,让个人技术去驱动繁荣。
20 世纪八十年代个人电脑出来后,Macintosh 把 GUI 与创意工具带到普通人桌面,催生桌面排版与数字设计行业。后来 21 世纪互联网博客以及油管这种创作平台出来后,迎来了网络文化生态的爆发。随后智能手机加应用商店,数百万独立开发者面向全球几十亿用户分发服务,诞生出了一堆超级应用。
这些案例的共同点都是「控制权」与「创新动能」从中心转向个人,带来的影响就是经济文化呈指数级长尾扩散。
Meta 把个人超级智能(PSI)描述为下一次跳跃,把几乎「博士级」的认知与创作能力缩到口袋和眼镜里,让普通个体也能获得专业能力去做专业的事。
Meta 的 AI 坎坷之路
听起来很高大上是吧,这一次光是挖人就搞的轰轰烈烈,把硅谷科技公司搞得人心惶惶,生怕下一个被挖的就是自家核心人物。
所以为啥 Meta 这一次忽然发狠呢?金融时报更是称比以前更有凝聚力了(more cohesive)。
你品一品。
当下 AI 战略很清晰,通过新成立的 Meta Super-intelligence Labs、双线并行的 AI Products / AGI Foundations 架构与千亿美元级算力投资,把所有研究、产品、硬件叙事都捆在同一个目标上。
但是相比之下,2023 年呢,战略像一坨七零八碎的拼图,同年 2 月刚成立 Generative AI product group 不久就又推出开源 LLaMA,与 FAIR、Reality Labs 之间缺少统一产品路线;外部定位上,“AI” 与 “元宇宙” 两条叙事并行,却互相稀释资源和投资者注意力。
这就不得不讲一下 Llama 的屈辱史以及 meta 在大语言模型上的失败…还有他们内部自己都不用 Llama 辅助。🤣
时间 | 经核查关键事件 | 影响与细节 |
---|---|---|
2023-03-03 | LLaMA-1 论文发布后不足一周即被完整权重包上传至 4chan 种子论坛并迅速扩散。 | - 研究许可证瞬间失效,任何人均可重训、魔改。 - Meta 试图发送 GitHub 下架通知,但为时已晚;模型成为“全民开源起点”。 - 美国参议员就泄露安全隐患向 Meta 致函质询。 |
2023-07-18 | Llama 2 改用“Llama Community License”:准商用、用户月活>7亿须另签授权。 | - OSI 明确声明“并非真正开源”,限制性条款引发社区抵触。 - 创业者与开发者转向更宽松的 Mistral、DeepSeek 等新秀模型,Llama 下载增速被反超。 |
2024-04-02 | 内部代码助手 Metamate 推出;默认先调用 Llama,遇到复杂问题回落 GPT-4 兜底。 | - 员工私下调侃“Llama ≠ Meta LLM”,对自研模型信心受挫。 - 暴露 Llama 在代码推理、长链调用等场景下仍逊色 GPT-4。 |
2024-12-04 | 离职员工匿名 memo 披露:“方向漂移、缺共识”,质疑管理层只求“发布里程碑”。 | - 华尔街分析师开始下调 Llama 商业化预期,Meta 股价当月回调8%。 |
2025-04-05 | Llama 4 三款 MoE 版本发布:Behemoth(2T 参数,待完工)、Maverick、Scout。 | - 官方宣称与 GPT-4o“旗鼓相当”,但独立评测显示 Maverick 仍落后 GPT-4o、DeepSeek V3 在复杂推理与编程任务上的一致性。 - 社区批评“冲榜优先”,多项基准被指数据“污染”;Meta 高层连夜澄清。 |
一年多里,Llama 经历“泄露—许可证争议—性能掉队”三连击,错失了抢占生态的最佳窗口。员工与投资者对 Llama 信心下降,导致人才流失(原 14 名作者走掉 11 名)。
所以现在可能是有点急了,不得不开始砸钱开始猛干了。
具体「更有凝聚力」体现在哪?
旧模式(≤ 2023) | 新模式(2025 起) |
---|---|
多中心:FAIR / Gen-AI / Reality Labs 各守一摊 | Meta Super-intelligence Labs (MSL) 成为唯一“顶层实验室” |
模型研发→产品迁移链条长 | AI Products 与 AGI Foundations 并列,两周迭代一版 demo,统一指标体系 |
算力按业务部申请 | 设立 Hyperion 级别 5 GW 数据中心池,直接对 MSL 开放预留 |
招人各自面试 | 最高层亲自“挖墙脚”,给 50 + 顶尖科学家开出据传最高 9 位数签约包 |
小扎亲自下场来找人了。
而且 superintelligence 的权利巨大,相当于是一个内部的初创公司,不受公司的束缚而且还管着公司一众 AI 相关的事务,此外小扎还承诺投入大量资金。
Meta 凭啥赌
有钱
法国巴黎银行研究后,认为 superintelligence 招过来这些人后续公司要多花 15 亿美元到 35 亿美元。当然了,在接受 the information 的采访的时候,小扎直言公司有钱,目前的商业模式足以支撑这样「造」。
首先能看到它的广告营收在 25 年的 Q2 就已经达到了 46 亿,在过往几年其实都达到了一个比较高的水平,97% 的收入都来自于广告。广告的利润你想一想,是很大的。
一季度净利 166 亿美元,二季度 183 亿美元——半年已赚 350 亿美元。即便后续每年额外支出 15–35 亿美元,也只占一季度利润的 8–19 %,财务上完全“扛得住”。
高溢价买人、大笔砸钱造数据中心,把钱撒着花……
在 5 月份的财报中,Meta 将其全年资本支出预测上调了多达 10%,640 亿到 720 亿美元之间,理由是“额外的数据中心投资”以支持其人工智能发展以及“基础设施硬件预期成本的增加”。并且 Meta 还买了一座核电站未来二十年的电力输出来支持其人工智能项目。
不过表面虽然豪横,还是有点力不从,据传 Meta 正寻求筹集 290 亿美元,以资助其全面进军人工智能的计划,并向私人资本公司寻求融资,以在美国建设数据中心。
有资源
除了有钱,他还有哪些资源?一说到 meta 首先大家想到的肯定是 Facebook、ins 以及 WhatsApp,这些产品加起来每天活跃用户数量就达到了三十多亿人,所以可以想象他只要做出一个产品出来推广速度可以多快,毕竟人家广告业务是王牌。
「工欲善其事必先利其器」
他们还在同时铺设「算力、数据、硬件终端」三条资源纵深,并与既有社交-广告生态形成闭环。
在算力方面有多座「泰坦级」数据中心在规划建设中,比如Prometheus(俄亥俄)是首个千兆瓦训练超算,500,000+ GPU,现场双燃气发电站。
为什么要搞这么大?为了「快」。
单一园区容纳 500,000+ GPU,可在 一张低延迟 InfiniBand/400 Gbps 网络 下并行训练 10 T+ 参数模型,直接减少跨站点梯度同步,训练周期从数月压缩到数周。
并且这样搞还能吸引顶级研究员,试问谁打过这么富裕的仗?
再看看小扎招了哪些人。
Noam Shazeer(Switch-ML 创始人、前 Google Brain)、Boris Power(前 Anthropic MoE 首席工程师)等人擅长 MoE 级模型架构,这方面 meta 内部经验薄弱。
Haoliang Jiang 是 Claude 长上下文技术负责人,可以帮助解决超长上下文梯度爆炸以及位置编码和缓存机制效率低。想推个人“记忆助手”,海量事件序列是不可避免的。
Alexander Kirillov(SAM)、Jaegle 兄弟(Perceiver 系列)是多模态方面的专家,可以帮助把把 Ray-Ban 眼镜数据转成训练集。
以及一些隐私方面和侧端微调的人才大脑……
其实可不可以比作赛车,顶级大脑是赛车手,算力数据中心就是赛车,燃料自然就是数据。或许这也是 meta斥资 $14.3 B 入股 Scale AI 的原因?直接锁定高质量数据标注团队,降低外采依赖。
再好的车也要有能发挥其全部潜力的车手才行,车手也离不开一辆好车,燃料的质量与数量也决定了他们能跑多快能跑多久。
最后,不要忘了 meta 一直在搞的终端设备Ray-Ban Meta 智能眼镜(2024–25 出货 >200 万副),这种个人的终端设备就是个人超级智能的承载工具,24 h 贴身多模态传感器 + 私域上下文入口。
以及还有一些腕表头显等等,为“体验任何冒险”提供沉浸式渲染与手势/生理数据输入。眼镜年销量突破 200 万、副活跃摄像头超 400 万颗,侧端入口已成规模,现在不抓紧搞啥时候开始。
AI + Meta??
我看到扎克伯格公开发布的那封信提到是要去帮助用户实现目标,创造理想世界,体验任何冒险。这有点像是将 AI 大模型和 VR/AR 硬件深度融合,然后构建一个元宇宙一样的概念。
又要冒险,要创造东西,我一瞬间就想到了电影《头号玩家》。
Meta 认为智能眼镜将成为未来主要计算设备。这一硬件形态天然适合融合个人AI助理(PSI)功能:眼镜上的摄像头、麦克风使AI可以“看到我们所见、听到我们所听”,随时理解用户所处环境并提供帮助。
凭借 AR 眼镜和 AI,用户能够在真实环境中叠加自己想要的数字信息和虚拟元素,实现对现实环境的个性化“改造”。例如,在自家客厅通过眼镜投射出一面虚拟巨幕影院,或是在办公桌上让AI生成一只可爱的虚拟宠物与你互动陪伴。
未来,每个人的眼镜所见都可以是独一无二的“增强现实”:你可以选择将周围环境渲染成科幻风格或者森林小径,AI会实时将建筑换成你喜欢的风格,天空中飘浮着你的创意数字艺术。
扎克伯格提出,让个人AI帮助人们“创造你想看到的世界,体验任何冒险”。这意味着在 Meta 的元宇宙中,每个人都可以成为创世者:用户可以按照自己喜好定制虚拟住宅的风格、打造只属于自己朋友圈的小型虚拟社交岛屿,甚至由AI根据你的梦境生成独特的世界供你探索。
元宇宙不再只是一个大型社交平台,更是现实的延伸和个性化投影。
不过当然,以上都是一些猜想,具体它要怎么去实现,我也不知道。
只是信里面说的是「个人主导」,其实也离不开他们自家的超算,应该还是中心-边缘混合,所谓的「个体主导」可能更像是「隐私隔离 + 长期个性化 + 端侧微调」,而不是完全的去中心化。
第二就是要为全球几十亿人去打造个人的超级助手,让每个人都能拥有和专业机构一样的研究能力,可能有点太高大上了?
因为首先,这个算力资源以及说能买得起你这个设备可能都是一个问题。最简单的,首先就是你买一个 Meta 眼镜,可能都要几百美金,然后你未来还需要去加一些侧端的算力的上面,那可能价格就更高了。当然,可能未来这个价格也是会慢慢降低,就像现在手机的价格,成本是会慢慢降下来的。
一旦你获取这个东西需要门槛,那可能就不能让所有人都去拥有。
有资源的群体 24 小时都有一个 AI 导师,然后又有个人实验室,人才积累曲线一下就陡升。但是没有资源的群体,还是在依赖传统的教育,信息隔层被放大。有资源的群体还可以去随手生成代码、3D图,零门槛地去创作,并且他可以去让 AI 帮他去理财,帮他去自动创作变现,形成一个飞轮。
最终结果就是「AI 新贫富分化”」的马太效应加剧。